eval loop_eval loop相关新闻_eval loop动态

Claude Code之父的夜班AI军团，Fable 5两个命令搭好

Claude Code之父Boris Cherny通过Loop机制和/goal命令构建自动化AI工作流，实现数千智能体协同编程、自主迭代与自我校验；其团队已基本停用人工写代码，转向设计自动化系统；Fable 5模型支持长期自主任务、内置验证闭环及图表理解能力，普通人可通过两个核心命令快速落地应用。

新智元07月20日 08:21

Coding Agent把Loop Engineering带火了，机器人的Loop还少了最关键一环

文章探讨Loop Engineering在AI领域的兴起，指出其核心是构建AI执行、反馈、修正的持续闭环，Coding Agent因软件世界天然具备高质量反馈而率先实现闭环；具身智能则面临真实世界反馈缺失难题，脸谱心智提出Ego-NeuroLoop数据范式，融合眼动、脑电、肌电与视觉信号，旨在采集人类动作背后的完整闭环过程，推动机器人从观察学习走向反馈驱动的闭环学习。

时氪分享07月08日 17:04

“如果你不能用300行代码写个Cursor，这行你就别待了！”Ralph Loop创造者、Claude Code核心技术设计者的暴论

Geoffrey Huntley提出Ralph Loop这一极简AI Agent循环机制，推动Coding Agent从一次性生成转向长时间运行；他指出软件开发已平民化，但真正的软件工程师需掌握验证、抽象与类型系统等硬核能力，并强调AI时代职业生存关键在于构建力而非使用力，警惕K型分化下传统企业的衰落。

极客邦科技InfoQ07月07日 21:01

全球Agent都在卷的「Loop工程」：AI自己干活、监工和返工

文章阐述AI Agent领域的新兴工程范式——Loop（循环）工程，强调其使Agent能自主理解目标、执行任务、检验结果并迭代修正，从而摆脱对人工提示词的依赖。Loop已成Claude Code、Codex等主流AI编程产品的核心能力，并正向研究、客服、运营等复杂工作场景扩展，推动AI从工具升级为协作者。

雷科技07月03日 07:53

老黄：Prompt已死，整个AI圈都在疯狂追Loop

AI领域正经历从提示词工程向循环工程（Loop Engineering）的范式转变，核心是构建自主运行的AI智能体闭环系统（发现→执行→验证→持久化→调度），取代人工反复编写提示词。硅谷多位技术领袖如黄仁勋、吴恩达、Karpathy及Anthropic、Google工程师等共同推动该趋势，强调人类角色从操作者转向系统架构师与判断力提供者。

新智元06月29日 16:33

Loop Engineering,Agent Engineering,Harness Engineering

从控制模型到控制智能体，Loop Engineering成为新焦点

文章系统梳理AI工程范式的三次演进：从Prompt Engineering（控制模型单次输出）到Harness Engineering（构建Agent运行环境），再到Loop Engineering（实现智能体自主行为控制）。重点阐释Loop Engineering作为新焦点，通过目标驱动、循环执行（观察-思考-行动-评估-重规划）取代传统流程驱动，提升Agent的自主性与适应性。

王吉伟06月26日 16:39

黄仁勋：Prompt正在过时，Loop才是新范式

黄仁勋提出AI开发新范式——Loop（循环），强调从手动编写Prompt转向设计自动化闭环系统：AI自主执行、自我验收、失败重试，直至目标达成。Loop使人类角色从指令执行者变为规则设计者，核心在于解耦编写与验收、引入独立验证机制，并已在Claude Code和OpenAI Codex等产品中落地。该范式代表AI工程化演进的第四阶段，本质是控制粒度上移与人机协作模式升级。

量子位06月25日 22:16

全网都在聊的Loop Engineering，到底改变了什么？

Loop Engineering 是 AI 编程新阶段的核心方法，强调构建可持续运转的自动化循环系统，涵盖任务发现、上下文组装、独立验证、状态持久化与调度重启五个环节；其本质不是提升代码生成能力，而是重构软件开发中人类判断、验证机制与流程约束的重心，Stripe 每周合并 1300 个 AI PR 等案例凸显可靠性源于系统性约束而非模型本身。

律动BlockBeats06月25日 19:50

大家最想要的全自动工作流，可能只是一场精神按摩

文章以实测方式探讨AI自动化工作流新概念'loop engineering'，指出其试图通过预设长文档指令让AI自主完成代码编写、测试、修复等闭环任务，但在实际调优Stable Diffusion模型时效果不佳，暴露出说明书编写困难、缺乏人工干预导致偏差累积、适用场景受限等问题，质疑其当前实用性。

差评06月24日 09:41

Loop Engineering：新的循环收费站

文章剖析Loop Engineering这一新概念的本质：它并非单纯技术突破，而是模型能力边际递减背景下，Anthropic与OpenAI等厂商推动的商业策略——通过推广‘循环’范式，将用户锁定在需持续调用API的工程管道中，从而在模型同质化时代开辟新增长点和收费入口。

AI唱反调06月23日 09:08

Prompt已死，Loop Engineering成了硅谷AI圈新顶流

文章探讨AI协作范式的升级，指出传统Prompt Engineering已显疲态，新兴的Loop Engineering（循环工程）成为硅谷新趋势。其核心是从人工反复提示转向设计自动化闭环系统，让AI自主执行、验证、反馈任务，强调目标定义、角色分工与系统化规则设计，同时警示其潜在风险如AI钻空子、人力退化和高成本问题。

超前实验室06月22日 17:36

写Prompt过时了？AI编程正在转向Loop Engineering

AI编程范式正从手动编写Prompt转向Loop Engineering（循环工程），即设计自动化工作流系统，由Automations、Worktrees、Skills、Plugins/Connectors和Sub-agents五大模块构成，并依赖外部记忆层持续运行。该模式强调将工程师的判断力前置到系统设计中，提升开发杠杆，但不替代人工验证与理解，核心挑战在于避免认知投降和理解债。

律动BlockBeats06月11日 01:53

大人，AI编程又变天了，Claude Code之父、龙虾创始人同时力捧新范式，杀死提示词工程？

AI编程范式正从手动提示词工程转向Loop Engineering，即开发者设计具备反馈闭环的循环系统来持续调度、验证和约束编程Agent。Claude Code创始人Boris Cherny与OpenAI工程师Peter Steinberger共同推动该趋势，强调通过/loops和Routines等原生机制实现长时间自主开发任务，但面临Token成本高、调试复杂及上下文衰减等现实挑战。

AI前线06月08日 19:16

如何用Hermes修复「AI味儿」

文章指出AI生成内容质量不稳定的根本原因不在提示词、模型或上下文等输入侧，而在缺失输出侧的质量控制机制；提出在开源Agent Hermes中构建eval loop（评估闭环），通过定义标准、量化评分、设置阈值、回归测试、审批拦截和生产监控，将AI输出质量从主观感受转化为可测量、可拦截、可优化的系统性工程。

律动BlockBeats06月02日 03:15

Agent评测的下半场：为什么需要一个「活的」Benchmark？

文章介绍Claw-Eval和Claw-Eval-Live两大AI Agent评测框架：前者通过执行轨迹、审计日志和环境快照实现过程可审计，解决‘Agent是否真做完任务’的问题；后者提出‘活的benchmark’概念，基于真实工作流信号动态构建任务快照，确保评测内容持续对齐企业实际业务需求，标志Agent评测进入关注真实工作流闭环能力的下半场。

新智元05月11日 15:05

暂无内容

加载更多

Claude Code之父的夜班AI军团，Fable 5两个命令搭好

Coding Agent把Loop Engineering带火了，机器人的Loop还少了最关键一环

“如果你不能用300行代码写个Cursor，这行你就别待了！”Ralph Loop创造者、Claude Code核心技术设计者的暴论

全球Agent都在卷的「Loop工程」：AI自己干活、监工和返工

老黄：Prompt已死，整个AI圈都在疯狂追Loop

从控制模型到控制智能体，Loop Engineering成为新焦点

黄仁勋：Prompt正在过时，Loop才是新范式

全网都在聊的Loop Engineering，到底改变了什么？

大家最想要的全自动工作流，可能只是一场精神按摩

Loop Engineering：新的循环收费站

Prompt已死，Loop Engineering成了硅谷AI圈新顶流

写Prompt过时了？AI编程正在转向Loop Engineering

大人，AI编程又变天了，Claude Code之父、龙虾创始人同时力捧新范式，杀死提示词工程？

如何用Hermes修复「AI味儿」

Agent评测的下半场：为什么需要一个「活的」Benchmark？

推荐专题

热门新闻

友情链接

投资AI和Web3，下载火星财经APP

账号密码登录

修改昵称

Claude Code之父的夜班AI军团，Fable 5两个命令搭好

Coding Agent把Loop Engineering带火了，机器人的Loop还少了最关键一环

“如果你不能用300行代码写个Cursor，这行你就别待了！”Ralph Loop创造者、Claude Code核心技术设计者的暴论

全球Agent都在卷的「Loop工程」：AI自己干活、监工和返工

老黄：Prompt已死，整个AI圈都在疯狂追Loop

从控制模型到控制智能体，Loop Engineering成为新焦点

黄仁勋：Prompt正在过时，Loop才是新范式

全网都在聊的Loop Engineering，到底改变了什么？

大家最想要的全自动工作流，可能只是一场精神按摩

Loop Engineering：新的循环收费站

Prompt已死，Loop Engineering成了硅谷AI圈新顶流

写Prompt过时了？AI编程正在转向Loop Engineering

大人，AI编程又变天了，Claude Code之父、龙虾创始人同时力捧新范式，杀死提示词工程？

如何用Hermes修复「AI味儿」

Agent评测的下半场：为什么需要一个「活的」Benchmark？

推荐专题

热门新闻

友情链接

投资AI和Web3，下载火星财经APP

商务合作